關於版本控制
什麼是版本控制? 以及為什麼讀者會在意它? 版本控制是一個能夠記錄一個或一組檔案在某一段時間的變更,使得讀者以後能取回特定版本的系統。 在本書的範例中,讀者會學到如何對軟體的原始碼做版本控制。 即使實際上讀者幾乎可以針對電腦上任意型態的檔案做版本控制。
若讀者是繪圖或網頁設計師且想要記錄每一版影像或版面配置(這也通常是讀者想要做的),採用版本控制系統(VCS)做這件事是非常明智的。 它允許讀者將檔案復原到原本的狀態、將整個專案復原到先前的狀態、比對某一段時間的修改、查看最後是誰在哪個時間點做了錯誤的修改導致問題發生,等。 使用版本控制系統一般也意謂著若讀者做了一些傻事或者遺失檔案,讀者能很容易地回復到原先的狀態。 更進一步,僅需付出很小的代價即可得到這些優點。
本地端版本控制
許多讀者採用複製檔案到其它目錄的方式來做版本控制(若他們夠聰明的話,或許會是有記錄時間戳記的目錄)。 因為它很簡單,這是個很常見的方法;但它也很容易出錯。 讀者很容易就忘記在哪個目錄,並不小心地把錯誤的檔案寫入、或者複製到不想要的檔案。
為了解決這問題,程式設計師在很久以前開發了本地端的版本控制系統,具備簡單的資料庫,用來記載檔案的所有變更記錄(參考圖1-1)。
圖1-1. 本地端版本控制流程圖。
這種版本控制工具中最流行的是rcs,目前仍存在於許多電腦。 即使是流行的Mac OS X作業系統,都會在讀者安裝開發工具時安裝rcs命令。 此工具基本上以特殊的格式記錄修補集合(patch set,即檔案從一個版本變更到另一個版本所需資訊),並儲存於磁碟上。 它就可以藉由套用各修補集合産生各時間點的檔案內容。
集中式版本控制系統
接下來人們遇到的主要問題是需要在多種其它系統上的開發協同作業。 為了解決此問題,集中式版本控制系統(Centralized Version Control Systems,簡稱CVCSs)被發展出來。 此系統,如:CVS、Subversion及Perforce皆具備單一伺服器,記錄所有版本的檔案,且有多個客戶端從伺服器從伺服器取出檔案。 在多年後,這已經是版本控制系統的標準(參考圖1-2)。
圖1-2. 集中式版本控制系統
這樣的配置提供了很多優點,特別是相較於本地端的版本控制系統來說。 例如:每個人皆能得知其它人對此專案做了些什麼修改有一定程度的瞭解。 管理員可調整存取權限,限制各使用者能做的事。 而且維護集中式版本控制系統也比維護散落在各使用者端的資料庫來的容易。
然而,這樣的配置也有嚴重的缺點。 最明顯的就是無法連上伺服器時。 如果伺服器當機一個小時,在這段時間中沒有人能進行協同開發的工作或者將變更的部份傳遞給其他使用者。 如果伺服器用來儲存資料庫的硬碟損毀,而且沒有相關的偏份資料。 除了使用者已取到本地端電腦的版本外,包含該專案開發的歷史的所有資訊都會遺失。 本地端版本控制系統也會有同樣的問題,只要使用者將整個專案的開發歷史都放在同一個地方,就有遺失所有資料的風險。
分散式版本控制系統
這就是分散式版本控制系統(Distributed Version Control Systems, 簡稱DVCSs)被引入的原因。 在分散式版本控制系統,諸如:Git、Mercurial、Bazaar、Darcs。 客戶端不只是取出最後一版的檔案,而是完整複製整個儲存庫。 即使是整個系統賴以運作的電腦損毀,皆可將任何一個客戶端先前複製的資料還原到伺服器。 每一次的取出動作實際上就是完整備份整個儲存庫。(參考圖1-3)
圖1-3. 分散式版本控制系統
更進一步來說,許多這類型的系統皆能同時與數個遠端的機器同時運作。 因此讀者能同時與許多不同群組的人們協同開發同一個專案。 這允許讀者設定多種集中式系統做不到的工作流程,如:階層式模式。